不靠专家出题,8万条人类终端录像,炼成首个真实CLI工作流基准TerminalWorld
不靠专家出题,8万条人类终端录像,炼成首个真实CLI工作流基准TerminalWorldAI Agent 正在重塑软件开发。写代码、修 bug,它的能力肉眼可见地往上涨。但软件开发,从来不止 "写代码" 这一件事。装环境、配依赖、部署服务、编排容器、管理云资源、处理安全策略,这些 "让软件活起来" 的脏活累活,才是真实开发的大头。而它们,几乎都发生在同一个地方:终端。
搜索
AI Agent 正在重塑软件开发。写代码、修 bug,它的能力肉眼可见地往上涨。但软件开发,从来不止 "写代码" 这一件事。装环境、配依赖、部署服务、编排容器、管理云资源、处理安全策略,这些 "让软件活起来" 的脏活累活,才是真实开发的大头。而它们,几乎都发生在同一个地方:终端。
可能是全球首家「AI 原生金融组织」。
日前,世界模型国际权威榜单 WorldArena 更新排名,中国科学院工业人工智能研究所徐凯研究员带领物理智能团队(The PAI Lab)自研的世界模型 PAIWorld 登顶。WorldArena 作为目前世界模型领域最权威的评测榜单,是针对具身世界模型的全方位评价体系,涵盖视觉质量、运动质量、内容一致性、物理遵循、三维准确性及可控性六大维度
我们最近在重新思考一件事:到底什么样的 Benchmark,才值得今天继续做?
公告显示,“妙时”(含AI奇遇)将于7月14日0时正式停止运营。目前,平台已停止新用户注册、充值及会员购买等服务。停运后,“妙时”将全面关闭所有功能。用户账号中剩余的妙时币、曲奇币、电波及会员费用,可于8月14日前通过邮件申请退款。
AI 教育创业里,最容易做成的产品,就是上传资料,生成笔记、题目和闪卡。这类产品很多,包括我们之前介绍过的 StudyFetch、NotebookLM、Quizlet、Knowt、Anki 的 AI 插件,都在解决类似问题。
OpenAI 的 tevfik 写了篇关于 loop engineering 的文章,开头那句我读完顿了一下。他说,他和 coding agent 协作,到现在大多还是同一个流程:我解释一个任务,等结果,审一遍,再发下一条指令。代码是 agent 写的,但我在后台还干着另一份活——我记着发生了什么、决定下一步做什么、判断这事到底完成没。
斯坦福胡佛研究所追踪了 DeepSeek 七篇论文背后 356 名研究者的完整职业轨迹。美国培养出的最优秀 AI 人才正在大规模回流中国,而中国本土管道已经能独立产出前沿模型的核心贡献者。
据悉,AI 推理芯片公司上海淬思科技有限公司(Trace Intelligence,以下简称“淬思”)近日完成孵化轮融资,砺思资本(Monolith)与启盈同创基金联合领投。本轮资金将用于首款面向智能体(Agent)推理的专用芯片研发与流片,以及核心团队扩充。
近期,在 LangChain 举办的智能体大会 Interrupt 上,吴恩达与 LangChain 创始人 Harrison Chase 进行了一场关于 AI Agent 的对谈。整场交流的核心并不是简单讨论 Agent 有多强,而是围绕一个更现实的问题展开:当 AI Agent 让软件开发变快之后,真正的瓶颈会转移到哪里?